home *** CD-ROM | disk | FTP | other *** search
/ Aminet 2 / Aminet AMIGA CDROM (1994)(Walnut Creek)[Feb 1994][W.O. 44790-1].iso / Aminet / util / gnu / emacs_src.lha / emacs-18.58 / cpp / cccp.c next >
C/C++ Source or Header  |  1992-09-22  |  66KB  |  2,547 lines

  1. /* C Compatible Compiler Preprocessor (CCCP)
  2. Copyright (C) 1986, Free Software Foundation, Inc.
  3.                     Written by Paul Rubin, June 1986
  4.  
  5.                NO WARRANTY
  6.  
  7.   BECAUSE THIS PROGRAM IS LICENSED FREE OF CHARGE, WE PROVIDE ABSOLUTELY
  8. NO WARRANTY, TO THE EXTENT PERMITTED BY APPLICABLE STATE LAW.  EXCEPT
  9. WHEN OTHERWISE STATED IN WRITING, FREE SOFTWARE FOUNDATION, INC,
  10. RICHARD M. STALLMAN AND/OR OTHER PARTIES PROVIDE THIS PROGRAM "AS IS"
  11. WITHOUT WARRANTY OF ANY KIND, EITHER EXPRESSED OR IMPLIED, INCLUDING,
  12. BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
  13. FITNESS FOR A PARTICULAR PURPOSE.  THE ENTIRE RISK AS TO THE QUALITY
  14. AND PERFORMANCE OF THE PROGRAM IS WITH YOU.  SHOULD THE PROGRAM PROVE
  15. DEFECTIVE, YOU ASSUME THE COST OF ALL NECESSARY SERVICING, REPAIR OR
  16. CORRECTION.
  17.  
  18.  IN NO EVENT UNLESS REQUIRED BY APPLICABLE LAW WILL RICHARD M.
  19. STALLMAN, THE FREE SOFTWARE FOUNDATION, INC., AND/OR ANY OTHER PARTY
  20. WHO MAY MODIFY AND REDISTRIBUTE THIS PROGRAM AS PERMITTED BELOW, BE
  21. LIABLE TO YOU FOR DAMAGES, INCLUDING ANY LOST PROFITS, LOST MONIES, OR
  22. OTHER SPECIAL, INCIDENTAL OR CONSEQUENTIAL DAMAGES ARISING OUT OF THE
  23. USE OR INABILITY TO USE (INCLUDING BUT NOT LIMITED TO LOSS OF DATA OR
  24. DATA BEING RENDERED INACCURATE OR LOSSES SUSTAINED BY THIRD PARTIES OR
  25. A FAILURE OF THE PROGRAM TO OPERATE WITH ANY OTHER PROGRAMS) THIS
  26. PROGRAM, EVEN IF YOU HAVE BEEN ADVISED OF THE POSSIBILITY OF SUCH
  27. DAMAGES, OR FOR ANY CLAIM BY ANY OTHER PARTY.
  28.  
  29.         GENERAL PUBLIC LICENSE TO COPY
  30.  
  31.   1. You may copy and distribute verbatim copies of this source file
  32. as you receive it, in any medium, provided that you conspicuously
  33. and appropriately publish on each copy a valid copyright notice
  34. "Copyright (C) 1986 Free Software Foundation"; and include
  35. following the copyright notice a verbatim copy of the above disclaimer
  36. of warranty and of this License.
  37.  
  38.   2. You may modify your copy or copies of this source file or
  39. any portion of it, and copy and distribute such modifications under
  40. the terms of Paragraph 1 above, provided that you also do the following:
  41.  
  42.     a) cause the modified files to carry prominent notices stating
  43.     that you changed the files and the date of any change; and
  44.  
  45.     b) cause the whole of any work that you distribute or publish,
  46.     that in whole or in part contains or is a derivative of this
  47.     program or any part thereof, to be licensed at no charge to all
  48.     third parties on terms identical to those contained in this
  49.     License Agreement (except that you may choose to grant more extensive
  50.     warranty protection to some or all third parties, at your option).
  51.  
  52.     c) You may charge a distribution fee for the physical act of
  53.     transferring a copy, and you may at your option offer warranty
  54.     protection in exchange for a fee.
  55.  
  56. Mere aggregation of another unrelated program with this program (or its
  57. derivative) on a volume of a storage or distribution medium does not bring
  58. the other program under the scope of these terms.
  59.  
  60.   3. You may copy and distribute this program (or a portion or derivative
  61. of it, under Paragraph 2) in object code or executable form under the terms
  62. of Paragraphs 1 and 2 above provided that you also do one of the following:
  63.  
  64.     a) accompany it with the complete corresponding machine-readable
  65.     source code, which must be distributed under the terms of
  66.     Paragraphs 1 and 2 above; or,
  67.  
  68.     b) accompany it with a written offer, valid for at least three
  69.     years, to give any third party free (except for a nominal
  70.     shipping charge) a complete machine-readable copy of the
  71.     corresponding source code, to be distributed under the terms of
  72.     Paragraphs 1 and 2 above; or,
  73.  
  74.     c) accompany it with the information you received as to where the
  75.     corresponding source code may be obtained.  (This alternative is
  76.     allowed only for noncommercial distribution and only if you
  77.     received the program in object code or executable form alone.)
  78.  
  79. For an executable file, complete source code means all the source code for
  80. all modules it contains; but, as a special exception, it need not include
  81. source code for modules which are standard libraries that accompany the
  82. operating system on which the executable file runs.
  83.  
  84.   4. You may not copy, sublicense, distribute or transfer this program
  85. except as expressly provided under this License Agreement.  Any attempt
  86. otherwise to copy, sublicense, distribute or transfer this program is void and
  87. your rights to use the program under this License agreement shall be
  88. automatically terminated.  However, parties who have received computer
  89. software programs from you with this License Agreement will not have
  90. their licenses terminated so long as such parties remain in full compliance.
  91.  
  92.  In other words, you are welcome to use, share and improve this program.
  93.  You are forbidden to forbid anyone else to use, share and improve
  94.  what you give them.   Help stamp out software-hoarding!  */
  95.  
  96. typedef unsigned char U_CHAR;
  97.  
  98. #ifdef EMACS
  99. #define NO_SHORTNAMES
  100. #ifdef AMIGA
  101. #include "/src/config.h"
  102. #undef fflush
  103. #undef fwrite
  104. #define fflush(fp) _flsbf(-1,fp)
  105. #undef main
  106. #undef AMIGA_DUMP
  107. #include <string.h>
  108. #else
  109. #include "../src/config.h"
  110. #endif
  111. #ifdef static
  112. #undef static
  113. #endif
  114. #ifdef open
  115. #undef open
  116. #undef close
  117. #undef read
  118. #undef write
  119. #endif /* open */
  120. #endif /* EMACS */
  121.  
  122. #include <sys/types.h>
  123. #include <sys/stat.h>
  124. #include <sys/file.h>
  125. #include <ctype.h>
  126. #include <stdio.h>
  127. #ifndef USG
  128. #ifdef AMIGA
  129. #include <time.h>
  130. #else
  131. #include <sys/time.h>        /* for __DATE__ and __TIME__ */
  132. #endif
  133. #else
  134. #define index strchr
  135. #define rindex strrchr
  136. #include <time.h>
  137. #include <fcntl.h>
  138. #endif /* USG */
  139.  
  140. #ifndef AMIGA
  141. void bcopy (), bzero ();
  142. int bcmp ();
  143. #endif
  144.  
  145. char *xmalloc (), *xrealloc (), *xcalloc ();
  146. void fatal (), pfatal_with_name (), perror_with_name ();
  147.  
  148. char *progname;
  149.  
  150. #define FATAL_EXIT_CODE 33    /* gnu cc command understands this */
  151.  
  152. struct directory_stack
  153.   {
  154.     struct directory_stack *next;
  155.     char *fname;
  156.   };
  157.  
  158. /* #include "file" starts with the first entry in the stack */
  159. /* #include <file> starts with the second. */
  160. /* -I directories are added after the first */
  161. #ifdef AMIGA
  162. struct directory_stack default_includes[2] =
  163.   {
  164.     { &default_includes[1], "" },
  165.     { 0, "cpp-include:" }
  166.   };
  167. #else
  168. struct directory_stack default_includes[2] =
  169.   {
  170.     { &default_includes[1], "." },
  171.     { 0, "/usr/include" }
  172.   };
  173. #endif
  174.  
  175. struct directory_stack *include = &default_includes[0];
  176.  
  177. #ifdef AMIGA
  178. int max_include_len = 14;    /* strlen (default_include) + 2
  179.                             (for / and null) */
  180. #else
  181. int max_include_len = 9;    /* strlen (default_include) + 1
  182.                             (for null) */
  183. #endif
  184.  
  185. char STDIN_FILE[] = "";        /* Empty, like real cpp */
  186. int put_out_comments = 0;    /* JF non-zero means leave comments in the
  187.                    output file.  Used by lint */
  188.  
  189. /* table to tell if char can be part of a C identifier. */
  190. U_CHAR is_idchar[256];
  191. /* table to tell if char can be first char of a c identifier. */
  192. U_CHAR is_idstart[256];
  193. /* table to tell if c is horizontal space.  isspace() thinks that
  194.    newline is space; this is not a good idea for this program. */
  195. U_CHAR is_hor_space[256];
  196.  
  197. /* I/O buffer structure.  Ought to be used for the output file too.
  198.    These are also used when there is no file present, for example,
  199.    when rescanning a definition.  Then, the fname field is null. */
  200. #define INPUT_STACK_MAX 100
  201. struct file_buf {
  202.   struct infile *next;    /* for making stacks of file ptrs */
  203.   char *fname;
  204.   int lineno;
  205.   int length;
  206.   U_CHAR *buf;
  207.   U_CHAR *bufp;
  208. } instack[INPUT_STACK_MAX];
  209. int indepth = 0;
  210.  
  211. typedef struct file_buf FILE_BUF;
  212.  
  213. /* The output buffer.  Its LENGTH field is the amount of room allocated
  214.    for the buffer, not the number of chars actually present.  To get
  215.    that, subtract outbuf.buf from outbuf.bufp. */
  216.  
  217. #define OUTBUF_SIZE 10    /* initial size of output buffer */
  218. FILE_BUF outbuf;
  219.  
  220. /* Structure allocated for every #define.  For a simple replacement
  221.    such as
  222.        #define foo bar ,
  223.    nargs = -1, the `pattern' list is null, and the expansion is just
  224.    the replacement text.  Nargs = 0 means a real macro with no args,
  225.    e.g.,
  226.        #define getchar() getc(stdin) .
  227.    When there are args, the expansion is the replacement text with the
  228.    args squashed out, and the reflist is a list describing how to
  229.    build the output from the input: e.g., "3 chars, then the 1st arg,
  230.    then 9 chars, then the 3rd arg, then 0 chars, then the 2nd arg".
  231.    The chars here come from the expansion.  Thus, for any definition
  232.    d , strlen(d->expansion) should equal the sum of all the
  233.    d->pattern->nchars.  Note that the list can be arbitrarily long---
  234.    its length depends on the number of times the arguements appear in
  235.    the replacement text, not how many args there are.  Example:
  236.    #define f(x) x+x+x+x+x+x+x would have replacement text "++++++" and
  237.    pattern list
  238.      { (0, 1), (1, 1), (1, 1), ..., (1, 1), NULL }
  239.    where (x, y) means (nchars, argno). */
  240.  
  241. typedef struct definition DEFINITION;
  242. struct definition {
  243.   int nargs;
  244.   int length;            /* length of expansion string */
  245.   U_CHAR *expansion;
  246.   struct reflist {
  247.     struct reflist *next;
  248.     int nchars;
  249.     int argno;
  250.   } *pattern;
  251. };
  252.  
  253. /* different kinds of things that can appear in the value field
  254.    of a hash node.  Actually, this may be useless now. */
  255. union hashval {
  256.   int ival;
  257.   char *cpval;
  258.   DEFINITION *defn;
  259. };
  260.  
  261.  
  262. /* The structure of a node in the hash table.  The hash table
  263.    has entries for all tokens defined by #define commands (type T_MACRO),
  264.    plus some special tokens like __LINE__ (these each have their own
  265.    type, and the appropriate code is run when that type of node is seen.
  266.    It does not contain control words like "#define", which are recognized
  267.    by a separate piece of code. */
  268. typedef struct hashnode HASHNODE;
  269. struct hashnode {
  270.   HASHNODE *next;        /* double links for easy deletion */
  271.   HASHNODE *prev;
  272.   HASHNODE **bucket_hdr;    /* also, a back pointer to this node's hash
  273.                    chain is kept, in case the node is the head
  274.                    of the chain and gets deleted. */
  275.   int type;            /* type of special token */
  276.   int length;            /* length of token, for quick comparison */
  277.   U_CHAR *name;            /* the actual name */
  278.   union hashval value;        /* pointer to expansion, or whatever */
  279. };
  280.  
  281.  
  282. HASHNODE *install();
  283. /* different flavors of hash nodes --- also used in keyword table */
  284. #define T_DEFINE    1    /* the "#define" keyword */
  285. #define T_INCLUDE    2    /* the "#include" keyword */
  286. #define T_IFDEF        3    /* the "#ifdef" keyword */
  287. #define T_IF        4    /* the "#if" keyword */
  288. #define T_EXPAND    5    /* argument to be expanded (now unused) */
  289. #define T_MACRO        6    /* macro defined by "#define" */
  290. #define T_ELSE        7    /* "#else" */
  291. #define T_PRAGMA    8    /* "#pragma" */
  292. #define T_ELIF        9    /* "#else" */
  293. #define T_UNDEF        10    /* "#undef" */
  294. #define T_LINE        11    /* "#line" */
  295. #define T_ERROR        12    /* "#error" */
  296. #define T_IFNDEF    13    /* "#ifndef"; forgot this earlier */
  297. #define T_ENDIF        14    /* "#endif" */
  298. #define T_SPECLINE    15    /* special symbol "__LINE__" */
  299. #define T_DATE        16    /* "__DATE__" */
  300. #define T_FILE        17    /* "__FILE__" */
  301. #define T_TIME        18    /* "__TIME__" */
  302.  
  303. #define T_SPEC_DEFINED    19    /* special macro for use in #if statements */
  304.  
  305.  
  306.  
  307. /* some more different types will be needed --- no longer bloody likely */
  308.  
  309.  
  310. int do_define(), do_line(), do_include(), do_undef(), do_error(),
  311.   do_pragma(), do_if(), do_xifdef(), do_else(),
  312.   do_elif(), do_endif();
  313.  
  314.  
  315. /* table of control words, along with code to execute when the keyword
  316.    is seen.  For now, it is searched linearly, so put the most frequently
  317.    found keywords at the beginning of the list. */
  318.  
  319. struct keyword_table {
  320.   int length;
  321.   int (*func)();
  322.   char *name;
  323.   int type;
  324. } keyword_table[] = {
  325.   {  6, do_define, "define", T_DEFINE},
  326.   {  4, do_line, "line", T_LINE},
  327.   {  7, do_include, "include", T_INCLUDE},
  328.   {  5, do_undef, "undef", T_UNDEF},
  329.   {  5, do_error, "error", T_ERROR},
  330.   {  2, do_if, "if", T_IF},
  331.   {  5, do_xifdef, "ifdef", T_IFDEF},
  332.   {  6, do_xifdef, "ifndef", T_IFNDEF},
  333.   {  4, do_else, "else", T_ELSE},
  334.   {  4, do_elif, "elif", T_ELIF},
  335.   {  5, do_endif, "endif", T_ENDIF},
  336.   {  6, do_pragma, "pragma", T_PRAGMA},
  337.   {  -1, 0, "", -1},
  338. };
  339.  
  340. /* Some definitions for the hash table.  The hash function MUST be
  341.    computed as shown in hashf() below.  That is because the rescan
  342.    loop computes the hash value `on the fly' for most tokens,
  343.    in order to avoid the overhead of a lot of procedure calls to
  344.    the hashf() function.  Hashf() only exists for the sake of
  345.    politeness, for use when speed isn't so important. */
  346.  
  347. #define HASHSIZE 1009
  348. HASHNODE *hashtab[HASHSIZE];
  349. #define HASHSTEP(old, c) ((old << 1) + c)
  350. #define MAKE_POS(v) (v & ~0x80000000) /* make number positive */
  351.  
  352. #define SKIP_WHITE_SPACE(p) { while (is_hor_space[*p]) p++; }
  353.  
  354.  
  355.  
  356. main (argc, argv)
  357.      int argc;
  358.      char **argv;
  359. {
  360.   struct stat sbuf;
  361.   char *in_fname, *out_fname;
  362.   int out_fd = 1;    /* default to stdout */
  363.   int f, i;
  364.   FILE_BUF *fp;
  365.  
  366.   progname = argv[0];
  367.   in_fname = NULL;
  368.   out_fname = NULL;
  369.   initialize_random_junk ();
  370.  
  371.   fp = &instack[indepth++];
  372.  
  373. /*  if (argc < 2)        JF no args means work as filter
  374.     return FATAL_EXIT_CODE; */
  375.  
  376.   for (i = 1; i < argc; i++) {
  377.     if (argv[i][0] != '-') {
  378.       if (out_fname != NULL)
  379.     fatal ("Usage: %s [switches] input output\n", argv[0]);
  380.       else if (in_fname != NULL) {
  381.     out_fname = argv[i];
  382.     if ((out_fd = creat (out_fname, 0666)) < 0)
  383.       pfatal_with_name (out_fname);
  384.       } else
  385.     in_fname = argv[i];
  386.     } else {
  387.       switch (argv[i][1]) {
  388.     U_CHAR *p;
  389.     struct directory_stack *dirtmp;
  390.       case 'D':
  391.     if ((p = (U_CHAR *) index(argv[i]+2, '=')) != NULL)
  392.       *p = ' ';
  393.     make_definition (argv[i] + 2);
  394.     break;
  395.       case 'U':        /* JF #undef something */
  396.     make_undef(argv[i] + 2);
  397.     break;
  398.       case 'C':        /* JF do later -C means leave comments alone! */
  399.     put_out_comments++;
  400.     break;
  401.       case 'E':            /* -E comes from cc -E; ignore it.  */
  402.     break;
  403.       case 'M':            /* Makefile dependencies or something like
  404.                    that.  Not implimented yet */
  405.     break;
  406.       case 'I':            /* JF handle directory path right */
  407.         dirtmp = (struct directory_stack *)
  408.             xmalloc (sizeof (struct directory_stack));
  409.     dirtmp->next = include->next;
  410.     include->next = dirtmp;
  411.     dirtmp->fname = argv[i]+2;
  412.     if (strlen (argv[i]) > max_include_len)
  413.       max_include_len = strlen (argv[i]);
  414.     break;
  415.  
  416.       case '\0': /* JF handle '-' as file name meaning stdin or stdout */
  417.     if (in_fname == NULL) {
  418.       in_fname = STDIN_FILE;
  419.       break;
  420.     } else if (out_fname == NULL) {
  421.       out_fname = "stdout";
  422.       break;
  423.     }    /* else fall through into error */
  424.  
  425.       default:
  426.     fatal ("Illegal option %s\n", argv[i]);
  427.       }
  428.     }
  429.   }
  430.  
  431.   /* JF check for stdin */
  432.   if (in_fname == STDIN_FILE || in_fname == NULL)
  433.     f = 0;
  434.   else if ((f = open (in_fname, O_RDONLY)) < 0)
  435.     goto perror;
  436.  
  437. #ifdef AMIGA
  438.   stat (in_fname, &sbuf);
  439. #else
  440.   fstat (f, &sbuf);
  441. #endif
  442.   fp->fname = in_fname;
  443.   fp->lineno = 1;
  444.   /* JF all this is mine about reading pipes and ttys */
  445.   if ((sbuf.st_mode & S_IFMT) != S_IFREG) {
  446.     int size;
  447.     int bsize;
  448.     int cnt;
  449.     U_CHAR *bufp;
  450.  
  451.     bsize = 2000;
  452.     size = 0;
  453.     fp->buf = (U_CHAR *) xmalloc (bsize + 1);
  454.     bufp = fp->buf;
  455.     for (;;) {
  456.       cnt = read (f, bufp, bsize - size);
  457.       if (cnt < 0) goto perror;    /* error! */
  458.       if (cnt == 0) break;    /* End of file */
  459.       size += cnt;
  460.       bufp += cnt;
  461.       if (bsize-size == 0) {    /* Buffer is full! */
  462.         bsize *= 2;
  463.         fp->buf = (U_CHAR *) xrealloc (fp->buf, bsize + 1);
  464.     bufp = fp->buf + size;    /* May have moved */
  465.       }
  466.     }
  467.     fp->buf[size] = '\0';
  468.     fp->length = size;
  469.   } else {
  470.     fp->length = sbuf.st_size;
  471.     fp->buf = (U_CHAR *) alloca (sbuf.st_size + 1);
  472.  
  473.     if (read (f, fp->buf, sbuf.st_size) != sbuf.st_size)
  474.       goto perror;
  475.  
  476.     fp->buf[sbuf.st_size] = '\0';
  477.   }
  478.  
  479.   /* initialize output buffer */
  480.   outbuf.buf = (U_CHAR *) xmalloc (OUTBUF_SIZE);
  481.   outbuf.bufp = outbuf.buf;
  482.   outbuf.length = OUTBUF_SIZE;
  483.  
  484.   output_line_command (fp, &outbuf);
  485.   rescan (fp, &outbuf);
  486.  
  487.   /* do something different than this later */
  488.   fflush (stdout);
  489.   write (out_fd, outbuf.buf, outbuf.bufp - outbuf.buf);
  490.   exit (0);
  491.  
  492.  perror:
  493.   pfatal_with_name (argv[1]);
  494. }
  495.  
  496. /*
  497.  * The main loop of the program.  Try to examine and move past most
  498.  * ordinary input chars as fast as possible.  Call appropriate routines
  499.  * when something special (such as a macro expansion) has to happen.
  500.  
  501. IP is the source of input to scan.
  502. OP is the place to put input. */
  503.  
  504. rescan (ip, op)
  505.      FILE_BUF *ip, *op;
  506. {
  507.   register int c;
  508.   register int ident_length = 0, hash = 0;
  509.   register U_CHAR *limit;
  510.   U_CHAR *check_expand ();
  511.   struct keyword_table *handle_directive ();
  512.   int excess_newlines = 0;
  513.   int escaped = 0;
  514.  
  515.   U_CHAR *bp;
  516.  
  517.   check_expand(op, ip->length);
  518.  
  519.   ip->bufp = ip->buf;
  520.   limit = ip->buf + ip->length;
  521.   while (1) {
  522.     if (ip->bufp < limit) {
  523.       c = *ip->bufp++;
  524.       *op->bufp++ = c;
  525.     } else {
  526.       c = -1;
  527.     }
  528.  
  529.     --escaped;
  530.     /* Now ESCAPED is 0 if and only if this character is escaped.  */
  531.  
  532.     switch (c) {
  533.     case '\\':
  534.       if (escaped == 0)
  535.     goto randomchar;
  536.       if (*ip->bufp != '\n')
  537.     {
  538.       escaped = 1;
  539.       goto randomchar;
  540.     }
  541.       /* always merge lines ending with backslash-newline */
  542.       ++ip->bufp;
  543.       ++ip->lineno;
  544.       ++excess_newlines;
  545.       --op->bufp;        /* remove backslash from obuf */
  546.       continue;            /* back to top of while loop */
  547.  
  548.     case '#':
  549.       /* # keyword: a # must be first nonblank char on the line */
  550.       for (bp = ip->bufp - 1; bp >= ip->buf; bp--)
  551.     if (*bp == '\n')
  552.       break;
  553.       bp++;            /* skip nl or move back into buffer */
  554.       SKIP_WHITE_SPACE (bp);
  555.       if (*bp != '#')
  556.     goto randomchar;
  557.       ident_length = hash = 0;
  558.       --op->bufp;        /* don't copy the '#' */
  559.  
  560.       if (handle_directive (ip, op, &excess_newlines) == NULL) {
  561.     ++op->bufp;        /* copy the '#' after all */
  562.     goto randomchar;
  563.       }
  564.       break;
  565.  
  566.     case '\"':            /* skip quoted string */
  567.     case '\'':
  568.       /* a single quoted string is treated like a double -- some
  569.      programs (e.g., troff) are perverse this way */
  570.  
  571.       if (escaped == 0)
  572.     goto randomchar;    /* false alarm-- it's escaped. */
  573.  
  574.       /* skip ahead to a matching quote.  */
  575.  
  576.       bp = ip->bufp;
  577.       while (bp < limit) {
  578.     *op->bufp++ = *bp;
  579.     switch (*bp++) {
  580.     case '\n':
  581.       ++ip->lineno;
  582.       break;
  583.     case '\\':
  584.       if (bp >= limit)
  585.         break;
  586.       if (*bp == '\n')
  587.         {
  588.           /* backslash newline is replaced by nothing at all,
  589.          but remember that the source line count is out of synch.  */
  590.           --op->bufp;
  591.           ++bp;
  592.           ++excess_newlines;
  593.           ++ip->lineno;
  594.         }
  595.       else
  596.         *op->bufp++ = *bp++;
  597.       break;
  598.     case '\"':
  599.     case '\'':
  600.       if (bp[-1] == c)
  601.         goto while2end;
  602.       break;
  603.     }
  604.       }
  605.     while2end:
  606.       ip->bufp = bp;
  607.       break;
  608.  
  609.     case '/':            /* possible comment */
  610.       if (*ip->bufp != '*')
  611.     goto randomchar;
  612.       if (put_out_comments) {
  613.         bp = ip->bufp;
  614.     *op->bufp++ = *bp++;
  615.       } else {
  616.     bp = ip->bufp + 1;
  617.     --op->bufp;        /* don't leave initial slash in buffer */
  618.       }
  619.  
  620.       for (;;) {
  621.     while (bp < limit) {
  622.       if (put_out_comments)
  623.         *op->bufp++ = *bp;
  624.       switch (*bp++) {
  625.       case '*':
  626.         goto whileend;
  627.       case '\n':
  628.         /* copy the newline into the output buffer, in order to
  629.            avoid the pain of a #line every time a multiline comment
  630.            is seen.  This means keywords with embedded comments
  631.            that contain newlines (blucch!) will lose.  By making
  632.            sure that excess_newlines is not just a flag, but really
  633.            an accurate count, it might be possible to get around this. */
  634.         if (!put_out_comments)
  635.           *op->bufp++ = '\n';
  636.         ++ip->lineno;
  637.       }
  638.     }
  639.       whileend:
  640.     if (bp >= limit) {
  641.       error ("unterminated comment");
  642.       break;        /* causes eof condition */
  643.     }
  644.     if (*bp == '/')
  645.       break;
  646.       }
  647.       if (put_out_comments)
  648.         *op->bufp++ = '/';
  649.       ip->bufp = bp + 1;
  650.       break;
  651.  
  652.     case '0': case '1': case '2': case '3': case '4':
  653.     case '5': case '6': case '7': case '8': case '9':
  654.       /* if digit is not part of identifier, it is random */
  655.       if (ident_length == 0)
  656.     goto randomchar;
  657.       /* fall through */
  658.  
  659.     case '_':
  660.     case 'a': case 'b': case 'c': case 'd': case 'e': case 'f':
  661.     case 'g': case 'h': case 'i': case 'j': case 'k': case 'l':
  662.     case 'm': case 'n': case 'o': case 'p': case 'q': case 'r':
  663.     case 's': case 't': case 'u': case 'v': case 'w': case 'x':
  664.     case 'y': case 'z':
  665.     case 'A': case 'B': case 'C': case 'D': case 'E': case 'F':
  666.     case 'G': case 'H': case 'I': case 'J': case 'K': case 'L':
  667.     case 'M': case 'N': case 'O': case 'P': case 'Q': case 'R':
  668.     case 'S': case 'T': case 'U': case 'V': case 'W': case 'X':
  669.     case 'Y': case 'Z':
  670.       ident_length++;
  671.       /* compute step of hash function, to avoid a proc call on every token */
  672.       hash = HASHSTEP(hash, c);
  673.       break;
  674.  
  675.     default:
  676. randomchar:
  677.       if (ident_length > 0) {
  678.     register HASHNODE *hp;
  679.     for (hp = hashtab[MAKE_POS(hash) % HASHSIZE]; hp != NULL;
  680.          hp = hp->next) {
  681.           U_CHAR *save_ibufp;    /* kludge, see below */
  682.  
  683.           if (hp->length == ident_length) {
  684.         register int i = ident_length;
  685.         register U_CHAR *p = hp->name;
  686.         register U_CHAR *q = op->bufp - i;
  687.  
  688.         if (c != -1)
  689.           q--;
  690.  
  691.         do {        /* all this to avoid a strncmp() */
  692.           if (*p++ != *q++)
  693.         goto hashcollision;
  694.         } while (--i);
  695.  
  696.         save_ibufp = ip->bufp;
  697.         /* back up over identifier, then expand token */
  698.         op->bufp -= ident_length;
  699.         if (c != -1) op->bufp--;
  700.         macroexpand (hp, ip, op, &excess_newlines);
  701.  
  702.         check_expand(op, ip->length - (ip->bufp - ip->buf));
  703.  
  704.         /* If we just processed an identifier at end of input,
  705.            return right away.  */
  706.         if (c == -1)
  707.           return;
  708.  
  709.         /* if the expansion routine has not moved the input
  710.            pointer, put back the char that ended the token.
  711.            This is a kludge because there might be a different
  712.            reason to put it back or not put it back. */
  713.         if (ip->bufp == save_ibufp)
  714.           *op->bufp++ = c;
  715.  
  716.         break;        /* out of for loop */
  717.       }
  718. hashcollision:
  719.            ;
  720.     }            /* end for loop */
  721.     ident_length = hash = 0; /* stop collecting identifier */
  722.       }
  723.  
  724.       /* If we just processed an identifier at end of input,
  725.      return right away.  */
  726.       if (c == -1)
  727.     return;
  728.  
  729.       /* count the newline, if it was one.  The reason this is
  730.      done down here instead of as a case in the switch is
  731.      that some expansions might want to look at the line
  732.      number, and if they happen right before the newline,
  733.      we don't want them to get the wrong one.  So the newline
  734.      must be counted AFTER any expansions happen. */
  735.       if (c == '\n') {
  736.     ++ip->lineno;
  737.     if (excess_newlines > 0) {
  738.       output_line_command (ip, op);
  739.       check_expand(op, ip->length - (ip->bufp - ip->buf));
  740.  
  741.       excess_newlines = 0;
  742.     }
  743.       }
  744.       break;            /* from switch */
  745.     }
  746.   }
  747. }
  748.  
  749. /*
  750.  * Process a # directive.  Expects ip->bufp to point to the '#', as in
  751.  * "#define foo bar".  Bumps *excess_newlines counter as necessary if
  752.  * the command is several lines long (and also updates ip->lineno).
  753.  * The main reason for this is that the comments could contain
  754.  * newlines, which would be confusing.  Passes to the command handler
  755.  * (do_define, do_include, etc.): the addresses of the 1st and
  756.  * last chars of the command (starting immediately after the #
  757.  * keyword), plus op and the keyword table pointer.  If the line
  758.  * contains comments the command is copied into a temporary buffer
  759.  * (sans comments) and the temporary buffer is passed to the command
  760.  * handler instead.
  761.  */
  762.  
  763. struct keyword_table *
  764. handle_directive (ip, op, excess_newlines)
  765.      FILE_BUF *ip, *op;
  766.      int *excess_newlines;
  767. {
  768.   register U_CHAR *bp, *cp;
  769.   register struct keyword_table *kt;
  770.   register int ident_length;
  771.  
  772.   /* Nonzero means we must copy the entire command
  773.      to get rid of comments or backslash-newlines.  */
  774.   int copy_command = 0;
  775.  
  776.   bp = ip->bufp;
  777.   SKIP_WHITE_SPACE(bp);
  778.   cp = bp;
  779.   while (is_idchar[*cp])
  780.     cp++;
  781.   ident_length = cp - bp;
  782.  
  783.   /*
  784.    * Decode the keyword and call the appropriate expansion
  785.    * routine, after moving the input pointer up to the next line.
  786.    * If the keyword is not a legitimate control word, return NULL.
  787.    * Otherwise, return ptr to the keyword structure matched.
  788.    */
  789.   for (kt = keyword_table; kt->length > 0; kt++) {
  790.     if (kt->length == ident_length && !strncmp(kt->name, bp, ident_length)) {
  791.       register U_CHAR *buf;
  792.       register U_CHAR *limit = ip->buf + ip->length;
  793.       U_CHAR *skip_to_end_of_comment();
  794.  
  795.       buf = bp = bp + ident_length;
  796.       while (bp < limit) {
  797.     if (*bp == '\'' || *bp == '\"') {        /* JF handle quotes right  */
  798.       U_CHAR quotec;
  799.  
  800.       for (quotec = *bp++; bp < limit && *bp != quotec; bp++) {
  801.         if (*bp == '\\') bp++;
  802.         if (*bp == '\n') {
  803.           if (bp[-1] == '\\')
  804.         copy_command++;
  805.           else {
  806.         /* --bp; */
  807.         break;    /* JF ugly, but might work */
  808.           }
  809.         }
  810.       }
  811.       continue;
  812.     }
  813.     if (*bp == '/' && bp[1] == '*') {
  814.       copy_command++;
  815.       ip->bufp = bp + 2;
  816.       skip_to_end_of_comment (ip, NULL);
  817.       bp = ip->bufp;
  818.       continue;
  819.     }
  820.  
  821.     if (*bp++ == '\n') {
  822.       if (*(bp-2) == '\\')
  823.         copy_command++;
  824.       else {
  825.         --bp;        /* point to the newline */
  826.         break;
  827.       }
  828.     }
  829.       }
  830.       if (copy_command) {
  831.     /* need to copy entire command into temp buffer before dispatching */
  832.  
  833.     cp = (U_CHAR *) alloca (bp - buf + 5); /* room for cmd plus
  834.                           some slop */
  835.     bp = buf;
  836.     buf = cp;
  837.  
  838.     while (bp < limit) {
  839.       if (*bp == '\'' || *bp == '\"') {    /* JF handle quotes right  */
  840.         U_CHAR quotec;
  841.  
  842.         *cp++ = *bp;
  843.         for (quotec = *bp++; bp < limit && *bp != quotec; *cp++ = *bp++) {
  844.           if (*bp == '\\')
  845.         *cp++ = *bp++;
  846.           if (*bp == '\n') {
  847.         if (bp[-1] == '\\') {
  848.           ++ip->lineno;
  849.           ++*excess_newlines;
  850.         } else break;    /* JF ugly, but might work */
  851.           }
  852.         }
  853.         continue;
  854.       }
  855.       if (*bp == '/' && bp[1] == '*') {
  856.         int newlines_found = 0;
  857.         ip->bufp = bp + 2;
  858.         skip_to_end_of_comment (ip, &newlines_found);
  859.         *excess_newlines += newlines_found;
  860.         ip->lineno += newlines_found;
  861.         bp = ip->bufp;
  862.         continue;
  863.       }
  864.  
  865.       if (*bp == '\n') {
  866.         if (bp[-1] == '\\') {
  867.           ++ip->lineno;
  868.           ++*excess_newlines;
  869.         } else
  870.           break;
  871.       }
  872.       *cp++ = *bp++;
  873.     }
  874.       }
  875.       else
  876.     cp = bp;
  877.  
  878.       ip->bufp = bp;        /* skip to the end of the command */
  879.  
  880.       /* call the appropriate command handler.  Buf now points to
  881.      either the appropriate place in the input buffer, or to
  882.      the temp buffer if it was necessary to make one.  Cp
  883.      points to the first char after the contents of the (possibly
  884.      copied) command, in either case. */
  885.       (*kt->func) (buf, cp, op, kt);
  886.       check_expand (op, ip->length - (ip->bufp - ip->buf));
  887.  
  888.       break;
  889.     }
  890.   }
  891.   if (kt->length <= 0)
  892.     kt = NULL;
  893.  
  894.   return kt;
  895. }
  896.  
  897. static char *monthnames[] = {"Jan", "Feb", "Mar", "Apr", "May", "Jun",
  898.                  "Jul", "Aug", "Sep", "Oct", "Nov", "Dec",
  899.                 };
  900.  
  901. /*
  902.  * expand things like __FILE__.  Place the expansion into the output
  903.  * buffer *without* rescanning.
  904.  */
  905. expand_special_symbol (hp, ip, op)
  906.      HASHNODE *hp;
  907.      FILE_BUF *ip, *op;
  908. {
  909.   char *buf;
  910.   int i, len;
  911.   FILE_BUF *last_ip = NULL;
  912.   static struct tm *timebuf = NULL;
  913.   struct tm *localtime();
  914.  
  915.   int paren = 0;        /* for special `defined' keyword */
  916.   HASHNODE *lookup();
  917.  
  918.   for (i = indepth - 1; i >= 0; i--)
  919.     if (instack[i].fname != NULL) {
  920.       last_ip = &instack[i];
  921.       break;
  922.     }
  923.   if (last_ip == NULL) {
  924.     error("CCCP error: not in any file?!");
  925.     return;            /* the show must go on */
  926.   }
  927.  
  928.   switch (hp->type) {
  929.   case T_FILE:
  930.     buf = (char *) alloca (3 + strlen(last_ip->fname));
  931.     sprintf (buf, "\"%s\"", last_ip->fname);
  932.     break;
  933.   case T_SPECLINE:
  934.     buf = (char *) alloca (10);
  935.     sprintf (buf, "%d", last_ip->lineno);
  936.     break;
  937.   case T_DATE:
  938.   case T_TIME:
  939.     if (timebuf == NULL) {
  940.       i = time(0);
  941.       timebuf = localtime(&i);
  942.     }
  943.     buf = (char *) alloca (20);
  944.     if (hp->type == T_DATE)
  945.       sprintf(buf, "\"%s %2d %4d\"", monthnames[timebuf->tm_mon - 1],
  946.           timebuf->tm_mday, timebuf->tm_year + 1900);
  947.     else
  948.       sprintf(buf, "\"%02d:%02d:%02d\"", timebuf->tm_hour, timebuf->tm_min,
  949.           timebuf->tm_sec);
  950.     break;
  951.   case T_SPEC_DEFINED:
  952.     buf = " 0 ";        /* assume symbol is not defined */
  953.     if (is_hor_space[*(ip->bufp-1)]) {
  954.       SKIP_WHITE_SPACE(ip->bufp);
  955.       if (*ip->bufp == '(') {
  956.     paren++;
  957.     ip->bufp++;            /* skip over the paren */
  958.       }
  959.     } else if (*(ip->bufp-1) == '(')
  960.       paren++;
  961.  
  962.     if (!is_idstart[*ip->bufp])
  963.       goto oops;
  964.     if (lookup(ip->bufp))
  965.       buf = " 1 ";
  966.     while (is_idchar[*ip->bufp])
  967.       ++ip->bufp;
  968.     SKIP_WHITE_SPACE (ip->bufp);
  969.     if (paren) {
  970.       if (*ip->bufp != ')')
  971.     goto oops;
  972.       ++ip->bufp;
  973.     }
  974.     break;
  975.  
  976. oops:
  977.  
  978.     error ("`defined' must be followed by IDENT or (IDENT)");
  979.     break;
  980.  
  981.   default:
  982.     error("CCCP error: illegal special hash type"); /* time for gdb */
  983.     abort ();
  984.   }
  985.   len = strlen(buf);
  986.   check_expand(op, len);
  987.   bcopy (buf, op->bufp, len);
  988.   op->bufp += len;
  989.  
  990.   return;
  991. }
  992.  
  993.  
  994. /* routines to handle #directives */
  995.  
  996. /*
  997.  * process include file by reading it in and calling rescan.
  998.  * expects to see "fname" or <fname> on the input.
  999.  * add error checking and -I option later.
  1000.  */
  1001.  
  1002. do_include (buf, limit, op, keyword)
  1003.      U_CHAR *buf, *limit;
  1004.      FILE_BUF *op;
  1005.      struct keyword_table *keyword;
  1006. {
  1007.   char *fname;        /* dynamically allocated fname buffer */
  1008.   U_CHAR *fbeg, *fend;        /* beginning and end of fname */
  1009.   U_CHAR term;            /* terminator for fname */
  1010.   int err = 0;            /* some error has happened */
  1011.   struct stat sbuf;        /* to stat the include file */
  1012.   FILE_BUF *fp;    /* for input stack frame */
  1013.   struct directory_stack *stackp;
  1014.   int flen, maxlen;
  1015.  
  1016.   int save_indepth = indepth;
  1017.                 /* in case of errors */
  1018.  
  1019.   int f;            /* file number */
  1020.   char *other_dir;        /* JF */
  1021.  
  1022.   f= -1;    /* JF we iz PARANOID! */
  1023.   fbeg = buf;
  1024.   SKIP_WHITE_SPACE(fbeg);
  1025.  
  1026.   switch (*fbeg++) {
  1027.   case '\"':
  1028.     term = '\"';
  1029.     stackp = include;
  1030.     break;
  1031.   case '<':
  1032.     term = '>';
  1033.     stackp = include->next;
  1034.     break;
  1035.   default:
  1036.     error ("#include expects \"fname\" or <fname>");
  1037.     fbeg--;            /* so person can see whole fname */
  1038.     err++;
  1039.     term = '\n';
  1040.     break;
  1041.   }
  1042.   for (fend = fbeg; *fend != term; fend++)
  1043.     {
  1044.       if (fend >= limit)
  1045.     {
  1046.       error ("illegal or unterminated include file name");
  1047.       goto nope;
  1048.     }
  1049.     }
  1050.  
  1051.   flen = fend - fbeg;
  1052.   if (err)
  1053.     goto nope;
  1054.  
  1055.   /* DG: This doesn't handle includes of aa:... on the Amiga */
  1056.   /* It doesn't seem worth it. */
  1057.   other_dir = NULL;
  1058.   maxlen = max_include_len;
  1059. #if 0
  1060.   if (stackp == include)
  1061.     {
  1062.       fp = &instack[indepth];
  1063.       while(--fp >= &instack[0])
  1064.     {
  1065.       int n;
  1066.       char *ep,*nam;
  1067.       extern char *rindex ();
  1068.  
  1069.       if ((nam = fp->fname) != NULL)
  1070.         {
  1071.           if ((ep = rindex (nam, '/')) != NULL)
  1072.         {
  1073.           n = ep - nam;
  1074.           other_dir = (char *) alloca (n + 1);
  1075.           strncpy (other_dir, nam, n);
  1076.           other_dir[n] = '\0';
  1077.                   if (n + 4 > maxlen) maxlen = n + 4;
  1078.         }
  1079.           break;
  1080.         }
  1081.     }
  1082.     }
  1083. #endif
  1084.               /* JF search directory path */
  1085.   fname = (char *) alloca (maxlen + flen);
  1086.   for (; stackp; stackp = stackp->next)
  1087.     {
  1088.       if (other_dir)
  1089.     {
  1090.       strcpy (fname, other_dir);
  1091.       other_dir = 0;
  1092.     }
  1093.       else
  1094.     strcpy (fname, stackp->fname);
  1095. #ifdef AMIGA
  1096.       if (fname[0] != 0 && fname[strlen(fname) - 1] != ':')
  1097.       /* Don't add / after : or empty strings */
  1098. #endif
  1099.       strcat (fname, "/");
  1100.       strncat (fname, fbeg, flen);
  1101.       if ((f = open (fname, O_RDONLY)) >= 0)
  1102.     break;
  1103.     }
  1104.   if (f < 0)
  1105.     {
  1106.       err++;
  1107.       goto nope;
  1108.     }
  1109.  
  1110. #ifdef AMIGA
  1111.   if (stat(fname, &sbuf) < 0)
  1112. #else
  1113.   if (fstat(f, &sbuf) < 0)
  1114. #endif
  1115.     {
  1116.       perror_with_name (fname);
  1117.       goto nope;        /* impossible? */
  1118.     }
  1119.  
  1120.   fp = &instack[indepth++];
  1121.   fp->buf = (U_CHAR *) alloca (sbuf.st_size + 1);
  1122.   fp->fname = fname;
  1123.   fp->length = sbuf.st_size;
  1124.   fp->lineno = 1;
  1125.  
  1126.   if (read(f, fp->buf, sbuf.st_size) != sbuf.st_size)
  1127.     goto nope;
  1128.  
  1129.   fp->buf[sbuf.st_size] = '\0';
  1130.  
  1131.   output_line_command (fp, op);
  1132.   rescan(fp, op);
  1133.  
  1134. nope:
  1135.  
  1136.   if (f > 0)
  1137.     close (f);
  1138.   indepth = save_indepth;
  1139.   output_line_command (&instack[indepth-1], op);
  1140.   if (err) {
  1141.     strncpy (fname, fbeg, flen);
  1142.     fname[flen] = '\0';
  1143.     perror_with_name (fname);
  1144.   }
  1145.   return err;
  1146. }
  1147.  
  1148. /* the arglist structure is built by do_define to tell
  1149.    collect_definition where the argument names begin.  That
  1150.    is, for a define like "#define f(x,y,z) foo+x-bar*y", the arglist
  1151.    would contain pointers to the strings x, y, and z.
  1152.    Collect_definition would then build a DEFINITION node,
  1153.    with reflist nodes pointing to the places x, y, and z had
  1154.    appeared.  So the arglist is just convenience data passed
  1155.    between these two routines.  It is not kept around after
  1156.    the current #define has been processed and entered into the
  1157.    hash table. */
  1158.  
  1159. struct arglist {
  1160.   struct arglist *next;
  1161.   U_CHAR *name;
  1162.   int length;
  1163.   int argno;
  1164. };
  1165.  
  1166. /* Process a #define command.
  1167. BUF points to the contents of the #define command, as a continguous string.
  1168. LIMIT points to the first character past the end of the definition.
  1169. KEYWORD is the keyword-table entry for #define.  */
  1170.  
  1171. do_define (buf, limit, op, keyword)
  1172.      U_CHAR *buf, *limit;
  1173.      FILE_BUF *op;
  1174.      struct keyword_table *keyword;
  1175. {
  1176.   U_CHAR *bp;            /* temp ptr into input buffer */
  1177.   U_CHAR *symname;        /* remember where symbol name starts */
  1178.   int sym_length;        /* and how long it is */
  1179.   U_CHAR *def;            /* beginning of expansion */
  1180.  
  1181.   DEFINITION *defn, *collect_expansion();
  1182.  
  1183.   bp = buf;
  1184.  
  1185.   while (is_hor_space[*bp])
  1186.     bp++;
  1187.   if (!is_idstart[*bp]) {
  1188.     error("illegal macro name: must start with an alphabetic or '_'");
  1189.     goto nope;
  1190.   }
  1191.   symname = bp;            /* remember where it starts */
  1192.   while (is_idchar[*bp] && bp < limit)
  1193.     bp++;
  1194.   sym_length = bp - symname;
  1195.  
  1196.   /* lossage will occur if identifiers or control keywords are broken
  1197.      across lines using backslash.  This is not the right place to take
  1198.      care of that. */
  1199.  
  1200.   if (is_hor_space[*bp] || *bp == '\n' || bp >= limit) {
  1201.     /* simple expansion or empty definition; gobble it */
  1202.     if (is_hor_space[*bp])
  1203.       def = ++bp;        /* skip exactly one blank/tab char */
  1204.     else
  1205.       def = bp;            /* empty definition */
  1206.  
  1207.     defn = (DEFINITION *) xmalloc (sizeof (DEFINITION) + limit - def);
  1208.     defn->nargs = -1;
  1209.     defn->pattern = NULL;
  1210.     defn->expansion = ((U_CHAR *) defn) + sizeof (DEFINITION);
  1211.     defn->length = limit - def;
  1212.     if (defn->length > 0)
  1213.       bcopy (def, defn->expansion, defn->length);
  1214.   }
  1215.   else if (*bp == '(') {
  1216.     struct arglist *arg_ptrs = NULL;
  1217.     int argno = 0;
  1218.  
  1219.     bp++;            /* skip '(' */
  1220.     SKIP_WHITE_SPACE(bp);
  1221.  
  1222.     while (*bp != ')') {
  1223.       struct arglist *temp;
  1224.  
  1225.       temp = (struct arglist *) alloca (sizeof (struct arglist));
  1226.       temp->name = bp;
  1227.       temp->next = arg_ptrs;
  1228.       temp->argno = ++argno;
  1229.       arg_ptrs = temp;
  1230.       while (is_idchar[*bp])
  1231.     bp++;
  1232.       temp->length = bp - temp->name;
  1233.       SKIP_WHITE_SPACE (bp);    /* there should not be spaces here,
  1234.                    but let it slide if there are. */
  1235.       if (temp->length == 0 || (*bp != ',' && *bp != ')')) {
  1236.     error ("illegal parameter to macro");
  1237.     goto nope;
  1238.       }
  1239.       if (*bp == ',') {
  1240.     bp++;
  1241.     SKIP_WHITE_SPACE(bp);
  1242.       }
  1243.       if (bp >= limit) {
  1244.     error ("unterminated format parameter list in #define");
  1245.     goto nope;
  1246.       }
  1247.     }
  1248.  
  1249.     ++bp;            /* skip paren */
  1250.     /* Skip exactly one space or tab if any.  */
  1251.     if (bp < limit && (*bp == ' ' || *bp == '\t')) ++bp;
  1252.  
  1253.     /* now everything from bp before limit is the definition. */
  1254.     defn = collect_expansion(bp, limit - bp, arg_ptrs);
  1255.   } else {
  1256.     error("#define symbol name not followed by SPC, TAB, or '('");
  1257.     goto nope;
  1258.   }
  1259.  
  1260.   {
  1261.     HASHNODE *hp, *lookup();
  1262.     DEFINITION *old_def;
  1263.     if ((hp = lookup(symname)) != NULL) {
  1264.       old_def = hp->value.defn;
  1265.       if (compare_defs(defn, old_def)) {
  1266.     U_CHAR *msg;            /* what pain... */
  1267.     msg = (U_CHAR *) alloca (sym_length + 20);
  1268.     bcopy (symname, msg, sym_length);
  1269.     strcpy (msg + sym_length, " redefined");
  1270.     error (msg);
  1271.     /* flush the most recent old definition */
  1272.     delete (hp);
  1273.       }
  1274.     }
  1275.   }
  1276.  
  1277.   install (symname, T_MACRO, defn);
  1278.   return 0;
  1279.  
  1280. nope:
  1281.  
  1282.   return 1;
  1283. }
  1284.  
  1285. /*
  1286.  * return zero if two DEFINITIONs are isomorphic
  1287.  */
  1288. static
  1289. compare_defs(d1, d2)
  1290.      DEFINITION *d1, *d2;
  1291. {
  1292.   struct reflist *a1, *a2;
  1293.  
  1294.   if (d1->nargs != d2->nargs || d1->length != d2->length)
  1295.     return 1;
  1296.   if (strncmp(d1->expansion, d2->expansion, d1->length) != 0)
  1297.     return 1;
  1298.   for (a1 = d1->pattern, a2 = d2->pattern; a1 && a2;
  1299.        a1 = a1->next, a2 = a2->next)
  1300.     if (a1->nchars != a2->nchars || a1->argno != a2->argno)
  1301.       return 1;
  1302.    return 0;
  1303. }
  1304.  
  1305. /* Read a macro definition for a macro with parameters.
  1306.    Build the DEFINITION structure.
  1307.    Reads SIZE characters of text starting at BUF.
  1308.    ARGLIST specifies the formal parameters to look for
  1309.    in the text of the definition.  */
  1310.  
  1311. static DEFINITION *
  1312. collect_expansion(buf, size, arglist)
  1313.      U_CHAR *buf;
  1314.      int size;
  1315.      struct arglist *arglist;
  1316. {
  1317.   DEFINITION *defn;
  1318.   U_CHAR *p, *lastp, *exp_p;
  1319.   int id_len;
  1320.   struct arglist *arg;
  1321.   struct reflist *endpat = NULL;
  1322.  
  1323.   /* scan thru the macro definition, ignoring comments and quoted
  1324.    strings, picking up on the macro calls.  It does a linear search
  1325.    thru the arg list on every potential symbol.  Profiling might say
  1326.    that something smarter should happen. */
  1327.  
  1328.  
  1329.   if (size < 0)
  1330.     abort ();
  1331.  
  1332.   defn = (DEFINITION *) xcalloc (1, sizeof (DEFINITION));
  1333.  
  1334.   /* watch out!  the arg count here depends on the order in which
  1335.      arglist was built.  you might have to count the args if
  1336.      you change something. */
  1337.   if (arglist != NULL)
  1338.     defn->nargs = arglist->argno;
  1339.   else
  1340.     defn->nargs = 0;
  1341.   exp_p = defn->expansion = (U_CHAR *) xmalloc (size + 1);
  1342.  
  1343.   /* write comment and quote handling
  1344.      and speed this loop up later; this is a stripped version */
  1345.  
  1346.   /* On the other hand, is it really worth doing that here?
  1347.      comments will get taken care of on rescan.  The sun /lib/cpp doc
  1348.      says that arg substitution happens even inside quoted strings,
  1349.      which would mean DON'T do anything with them here.  Check the
  1350.      standard on this. */
  1351.  
  1352.   lastp = p = buf;
  1353.   while (p < buf+size) {
  1354.     int skipped_arg = 0;
  1355.  
  1356.     if (is_idstart[*p] && (p==buf || !is_idchar[*(p-1)])) {
  1357.  
  1358.       for (id_len = 0; p+id_len < buf+size && is_idchar[p[id_len]]; id_len++)
  1359.     ;
  1360.       for (arg = arglist; arg != NULL; arg = arg->next) {
  1361.     struct reflist *tpat;
  1362.  
  1363.     if (arg->length == id_len && strncmp(arg->name, p, id_len) == 0) {
  1364.       /* make a pat node for this arg and append it to the end of
  1365.          the pat list */
  1366.       tpat = (struct reflist *) xmalloc (sizeof (struct reflist));
  1367.       tpat->next = NULL;
  1368.       if (endpat == NULL)
  1369.         defn->pattern = tpat;
  1370.       else
  1371.         endpat->next = tpat;
  1372.       endpat = tpat;
  1373.  
  1374.       tpat->argno = arg->argno;
  1375.       tpat->nchars = p - lastp;
  1376.       p += id_len;
  1377.       lastp = p;        /* place to start copying from next time */
  1378.       skipped_arg++;
  1379.       break;
  1380.     }
  1381.       }
  1382.     }
  1383.  
  1384.     if (skipped_arg == 0)
  1385.       *exp_p++ = *p++;
  1386.   }
  1387.  
  1388.   *exp_p++ = '\0';
  1389.  
  1390.   defn->length = exp_p - defn->expansion - 1;
  1391.  
  1392.   /* give back excess storage */
  1393.   defn->expansion = (U_CHAR *) xrealloc (defn->expansion, defn->length + 1);
  1394.  
  1395.   return defn;
  1396. }
  1397.  
  1398. #ifdef DEBUG
  1399. /*
  1400.  * debugging routine ---- return a ptr to a string containing
  1401.  *   first n chars of s.  Returns a ptr to a static object
  1402.  *   since I happen to know it will fit.
  1403.  */
  1404. static U_CHAR *
  1405. prefix (s, n)
  1406.      U_CHAR *s;
  1407.      int n;
  1408. {
  1409.   static U_CHAR buf[1000];
  1410.   bcopy (s, buf, n);
  1411.   buf[n] = '\0';        /* this should not be necessary! */
  1412.   return buf;
  1413. }
  1414. #endif
  1415.  
  1416. /*
  1417.  * interpret #line command.  Remembers previously seen fnames
  1418.  * in its very own hash table.
  1419.  */
  1420. #define FNAME_HASHSIZE 37
  1421.  
  1422. do_line(buf, limit, op, keyword)
  1423.      U_CHAR *buf, *limit;
  1424.      FILE_BUF *op;
  1425.      struct keyword_table *keyword;
  1426. {
  1427.   register U_CHAR *bp;
  1428.   FILE_BUF *ip = &instack[indepth - 1];
  1429.  
  1430.   bp = buf;
  1431.   ip->lineno = atoi(bp);
  1432.   /* this time, skip to the end of the line WITHOUT
  1433.      bumping lineno.  If line counting is consolidated,
  1434.      this will have to be hacked, perhaps horribly. */
  1435.  
  1436.   /* skip over blanks, optional sign, digits, blanks. */
  1437.   SKIP_WHITE_SPACE (bp);
  1438.   if (*bp == '-' || *bp == '+')
  1439.     bp++;
  1440.   while (isdigit(*bp))
  1441.     bp++;
  1442.   SKIP_WHITE_SPACE (bp);
  1443.  
  1444.   if (*bp != '\n') {        /* if eol, then don't hack fname */
  1445.     static HASHNODE *fname_table[FNAME_HASHSIZE];
  1446.     HASHNODE *hp, **hash_bucket;
  1447.     U_CHAR *fname;
  1448.     int fname_length;
  1449.  
  1450.     if (*bp != '"') {
  1451.       error ("#line directive must be #line NNN [\"fname\"]");
  1452.       goto done;
  1453.     }
  1454.     fname = ++bp;
  1455.  
  1456.     while (*bp != '"' && bp < limit)
  1457.       bp++;
  1458.     if (*bp != '"') {
  1459.       error ("Unterminated fname in #line command");
  1460.       goto done;
  1461.     }
  1462.     fname_length = bp - fname;
  1463.     hash_bucket =
  1464.       &fname_table[hashf(fname, fname_length, FNAME_HASHSIZE)];
  1465.     for (hp = *hash_bucket; hp != NULL; hp = hp->next)
  1466.       if (hp->length == fname_length &&
  1467.       strncmp(hp->value.cpval, fname, fname_length) == 0) {
  1468.     ip->fname = hp->value.cpval;
  1469.     goto done;
  1470.       }
  1471.     /* didn't find it, cons up a new one */
  1472.     hp = (HASHNODE *) xcalloc (1, sizeof (HASHNODE) + fname_length + 1);
  1473.     hp->next = *hash_bucket;
  1474.     *hash_bucket = hp;
  1475.  
  1476.     hp->length = fname_length;
  1477.     ip->fname = hp->value.cpval = ((char *) hp) + sizeof (HASHNODE);
  1478.     bcopy (fname, hp->value.cpval, fname_length);
  1479.   }
  1480.  
  1481. done:
  1482.  
  1483.   output_line_command (ip, op);
  1484.   check_expand (op, ip->length - (ip->bufp - ip->buf));
  1485. }
  1486.  
  1487. /*
  1488.  * remove all definitions of symbol from symbol table.
  1489.  * according to un*x /lib/cpp, it is not an error to undef
  1490.  * something that has no definitions, so it isn't one here either.
  1491.  */
  1492. do_undef(buf, limit, op, keyword)
  1493.      U_CHAR *buf, *limit;
  1494.      FILE_BUF *op;
  1495.      struct keyword_table *keyword;
  1496. {
  1497.   register U_CHAR *bp;
  1498.   HASHNODE *hp, *lookup();
  1499.  
  1500.   SKIP_WHITE_SPACE (buf);
  1501.  
  1502.   while ((hp = lookup(buf)) != NULL)
  1503.     delete (hp);
  1504. }
  1505.  
  1506. /* handle #error command later */
  1507. do_error()
  1508. {
  1509. }
  1510.  
  1511. /*
  1512.  * the behavior of the #pragma directive is implementation defined.
  1513.  * this implementation defines it as follows.
  1514.  */
  1515. #ifdef AMIGA
  1516. do_pragma(buf, limit, op, keyword)
  1517.      U_CHAR *buf, *limit;
  1518.      FILE_BUF *op;
  1519.      struct keyword_table *keyword;
  1520. {
  1521.     /* Just copy the pragma directibe back out */
  1522.     int len2 = limit - buf, len1 = sizeof("#pragma") - 1;
  1523.  
  1524.     check_expand(op, len1 + len2);
  1525.     bcopy("#pragma", op->bufp, len1);
  1526.     bcopy(buf, op->bufp + len1, len2);
  1527.     op->bufp += len1 + len2;
  1528. }
  1529. #else
  1530. do_pragma()
  1531. {
  1532.   close (0);
  1533.   if (open ("/dev/tty", O_RDONLY) != 0)
  1534.     goto nope;
  1535.   close (1);
  1536.   if (open("/dev/tty", O_WRONLY) != 1)
  1537.     goto nope;
  1538.   execl("/usr/games/rogue", "#pragma", 0);
  1539.   execl("/usr/games/hack", "#pragma", 0);
  1540.   execl("/usr/new/emacs -f hanoi 9 -kill", "#pragma", 0);
  1541. nope:
  1542.   fatal ("You are in a maze of twisty compiler features, all different");
  1543. }
  1544. #endif
  1545.  
  1546. typedef struct if_stack {
  1547.   struct if_stack *next;    /* for chaining to the next stack frame */
  1548.   char *fname;        /* copied from input when frame is made */
  1549.   int lineno;            /* similarly */
  1550.   int if_succeeded;        /* true if a leg of this if-group
  1551.                     has been passed through rescan */
  1552.   int type;            /* type of last directive seen in this group */
  1553. };
  1554. typedef struct if_stack IF_STACK_FRAME ;
  1555. IF_STACK_FRAME *if_stack = NULL;
  1556.  
  1557. /*
  1558.  * handle #if command by
  1559.  *   1) inserting special `defined' keyword into the hash table
  1560.  *    that gets turned into 0 or 1 by expand_special_symbol (thus,
  1561.  *    if the luser has a symbol called `defined' already, it won't
  1562.  *      work inside the #if command)
  1563.  *   2) rescan the input into a temporary output buffer
  1564.  *   3) pass the output buffer to the yacc parser and collect a value
  1565.  *   4) clean up the mess left from steps 1 and 2.
  1566.  *   5) call conditional_skip to skip til the next #endif (etc.),
  1567.  *      or not, depending on the value from step 3.
  1568.  */
  1569. do_if (buf, limit, op, keyword)
  1570.      U_CHAR *buf, *limit;
  1571.      FILE_BUF *op;
  1572.      struct keyword_table *keyword;
  1573. {
  1574.   int value;
  1575.   FILE_BUF *ip = &instack[indepth - 1];
  1576.  
  1577.   value = eval_if_expression (buf, limit - buf);
  1578.   conditional_skip (ip, value == 0, T_IF);
  1579. }
  1580.  
  1581. /*
  1582.  * handle a #elif directive by not changing  if_stack  either.
  1583.  * see the comment above do_else.
  1584.  */
  1585.  
  1586. do_elif (buf, limit, op, keyword)
  1587.      U_CHAR *buf, *limit;
  1588.      FILE_BUF *op;
  1589.      struct keyword_table *keyword;
  1590. {
  1591.   int value;
  1592.   FILE_BUF *ip = &instack[indepth - 1];
  1593.  
  1594.   if (if_stack == NULL)
  1595.     error ("if-less #elif");
  1596.   else {
  1597.     if (if_stack->type != T_IF && if_stack->type != T_ELIF) {
  1598.       error ("#elif after #else");
  1599.       fprintf (stderr, " (matches line %d", if_stack->lineno);
  1600.       if (if_stack->fname != NULL && ip->fname != NULL &&
  1601.       strcmp(if_stack->fname, ip->fname) != 0)
  1602.     fprintf (stderr, ", file %s", if_stack->fname);
  1603.       fprintf(stderr, ")\n");
  1604.     }
  1605.     if_stack->type = T_ELIF;
  1606.   }
  1607.  
  1608.   value = eval_if_expression (buf, limit - buf);
  1609.   conditional_skip (ip, value == 0, T_ELIF);
  1610. }
  1611.  
  1612. /*
  1613.  * evaluate a #if expression in BUF, of length LENGTH,
  1614.  * making careful arrangements to handle `defined' and
  1615.  * prepare for calling the yacc parser.
  1616.  */
  1617. static int
  1618. eval_if_expression (buf, length)
  1619.      U_CHAR *buf;
  1620.      int length;
  1621. {
  1622.   FILE_BUF temp_ibuf, temp_obuf;
  1623.   HASHNODE *save_defined;
  1624.   int value;
  1625.  
  1626.   bzero (&temp_ibuf, sizeof temp_ibuf);    /* paranoia */
  1627.   temp_ibuf.length = length;
  1628.   temp_ibuf.buf = temp_ibuf.bufp = buf;
  1629.  
  1630.   temp_obuf.length = length;
  1631.   temp_obuf.bufp = temp_obuf.buf = (U_CHAR *) xmalloc (length);
  1632.  
  1633.   save_defined = install("defined", T_SPEC_DEFINED, 0);
  1634.   rescan (&temp_ibuf, &temp_obuf);
  1635.   *temp_obuf.bufp = '\0';
  1636.   value = parse_c_expression(temp_obuf.buf);
  1637.  
  1638.   delete (save_defined);    /* clean up special symbol */
  1639.   free (temp_obuf.buf);
  1640.  
  1641.   return value;
  1642. }
  1643.  
  1644. /*
  1645.  * routine to handle ifdef/ifndef.  Try to look up the symbol,
  1646.  * then do or don't skip to the #endif/#else/#elif depending
  1647.  * on what directive is actually being processed.
  1648.  */
  1649. do_xifdef (buf, limit, op, keyword)
  1650.      U_CHAR *buf, *limit;
  1651.      FILE_BUF *op;
  1652.      struct keyword_table *keyword;
  1653. {
  1654.   HASHNODE *lookup();
  1655.   int skip;
  1656.   FILE_BUF *ip = &instack[indepth - 1];
  1657.  
  1658.   SKIP_WHITE_SPACE (buf);
  1659.   skip = (lookup(buf) == NULL) ^ (keyword->type == T_IFNDEF);
  1660.   conditional_skip (ip, skip, T_IF);
  1661. }
  1662.  
  1663. /*
  1664.  * push TYPE on stack; then, if SKIP is nonzero, skip ahead.
  1665.  */
  1666. static
  1667. conditional_skip (ip, skip, type)
  1668.      FILE_BUF *ip;
  1669.      int skip, type;
  1670. {
  1671.   IF_STACK_FRAME *temp;
  1672.  
  1673.   temp = (IF_STACK_FRAME *) xcalloc (1, sizeof (IF_STACK_FRAME));
  1674.   temp->fname = ip->fname;
  1675.   temp->lineno = ip->lineno;
  1676.   temp->next = if_stack;
  1677.   if_stack = temp;
  1678.  
  1679.   if_stack->type = type;
  1680.  
  1681.   if (skip != 0) {
  1682.     skip_if_group(ip);
  1683.     return;
  1684.   } else {
  1685.     ++if_stack->if_succeeded;
  1686.     output_line_command(ip, &outbuf);    /* JF */
  1687.   }
  1688. }
  1689.  
  1690. /*
  1691.  * skip to #endif, #else, or #elif.  adjust line numbers, etc.
  1692.  * leaves input ptr at the sharp sign found.
  1693.  */
  1694. static
  1695. skip_if_group(ip)
  1696.      FILE_BUF *ip;
  1697. {
  1698.   register U_CHAR *bp = ip->bufp, *cp;
  1699.   register U_CHAR *endb = ip->buf + ip->length;
  1700.   struct keyword_table *kt;
  1701.   U_CHAR *save_sharp, *skip_to_end_of_comment (), *skip_quoted_string ();
  1702.   IF_STACK_FRAME *save_if_stack = if_stack; /* don't pop past here */
  1703.  
  1704.   while (bp <= endb) {
  1705.     switch (*bp++) {
  1706.     case '/':            /* possible comment */
  1707.       if (*bp == '*') {
  1708.     ip->bufp = ++bp;
  1709.     bp = skip_to_end_of_comment (ip, &ip->lineno);
  1710.       }
  1711.       break;
  1712.     case '\"':
  1713.     case '\'':
  1714.       ip->bufp = bp - 1;
  1715.       bp = skip_quoted_string (ip, NULL);    /* JF was (ip) */
  1716.       break;
  1717.     case '\n':
  1718.       ++ip->lineno;
  1719.       break;
  1720.     case '#':
  1721.       /* # keyword: the # must be first nonblank char on the line */
  1722.       for (cp = bp - 1; cp >= ip->buf; cp--)
  1723.     if (*cp == '\n')
  1724.       break;
  1725.       cp++;            /* skip nl or move back into buffer */
  1726.       SKIP_WHITE_SPACE (cp);
  1727.       if (cp != bp - 1)    /* ????? */
  1728.     break;
  1729.  
  1730.       save_sharp = cp;        /* point at '#' */
  1731.       SKIP_WHITE_SPACE (bp);
  1732.       for (kt = keyword_table; kt->length >= 0; kt++) {
  1733.     IF_STACK_FRAME *temp;
  1734.     if (strncmp(bp, kt->name, kt->length) == 0
  1735.         && !is_idchar[bp[kt->length]]) {
  1736.       switch (kt->type) {
  1737.       case T_IF:
  1738.       case T_IFDEF:
  1739.       case T_IFNDEF:
  1740.         temp = (IF_STACK_FRAME *) xcalloc (1, sizeof (IF_STACK_FRAME));
  1741.         temp->next = if_stack;
  1742.         if_stack = temp;
  1743.         temp->lineno = ip->lineno;
  1744.         temp->fname = ip->fname;
  1745.         temp->type = kt->type;
  1746.         break;
  1747.       case T_ELSE:
  1748.       case T_ELIF:
  1749.       case T_ENDIF:
  1750.         ip->bufp = save_sharp;
  1751.         if (if_stack == NULL) {
  1752.           U_CHAR msg[50];
  1753.           sprintf (msg, "if-less #%s", kt->name);
  1754.           error (msg);
  1755.           break;
  1756.         }
  1757.         else if (if_stack == save_if_stack)
  1758.           return;        /* found what we came for */
  1759.  
  1760.         if (kt->type != T_ENDIF) {
  1761.           if (if_stack->type == T_ELSE)
  1762.         error ("#else or #elif after #else");
  1763.           if_stack->type = kt->type;
  1764.           break;
  1765.         }
  1766.  
  1767.         temp = if_stack;
  1768.         if_stack = if_stack->next;
  1769.         free (temp);
  1770.         break;
  1771.       }
  1772.     }
  1773.       }
  1774.     }
  1775.   }
  1776.   ip->bufp = bp;
  1777.   ip->lineno = instack->lineno; /* bufp won't be right, though */
  1778.   error ("unterminated #if/#ifdef/#ifndef conditional");
  1779.   /* after this returns, the main loop will exit because ip->bufp
  1780.      now points to the end of the buffer.  I am not sure whether
  1781.      this is dirty or not. */
  1782.   return;
  1783. }
  1784.  
  1785. /*
  1786.  * handle a #else directive.  Do this by just continuing processing
  1787.  * without changing  if_stack ;  this is so that the error message
  1788.  * for missing #endif's etc. will point to the original #if.  It
  1789.  * is possible that something different would be better.
  1790.  */
  1791. do_else(buf, limit, op, keyword)
  1792.      U_CHAR *buf, *limit;
  1793.      FILE_BUF *op;
  1794.      struct keyword_table *keyword;
  1795. {
  1796.   register U_CHAR *bp;
  1797.   FILE_BUF *ip = &instack[indepth - 1];
  1798.  
  1799.   if (if_stack == NULL) {
  1800.     error ("if-less #else");
  1801.     return;
  1802.   } else {
  1803.     if (if_stack->type != T_IF && if_stack->type != T_ELIF) {
  1804.       error ("#else after #else");
  1805.       fprintf (stderr, " (matches line %d", if_stack->lineno);
  1806.       if (strcmp(if_stack->fname, ip->fname) != 0)
  1807.     fprintf (stderr, ", file %s", if_stack->fname);
  1808.       fprintf(stderr, ")\n");
  1809.     }
  1810.     if_stack->type = T_ELSE;
  1811.   }
  1812.  
  1813.   if (if_stack->if_succeeded)
  1814.     skip_if_group (ip);
  1815.   else {
  1816.     ++if_stack->if_succeeded;    /* continue processing input */
  1817.     output_line_command(ip, op);    /* JF try to keep line #s right? */
  1818.   }
  1819. }
  1820.  
  1821. /*
  1822.  * unstack after #endif command
  1823.  */
  1824. do_endif(buf, limit, op, keyword)
  1825.      U_CHAR *buf, *limit;
  1826.      FILE_BUF *op;
  1827.      struct keyword_table *keyword;
  1828. {
  1829.   register U_CHAR *bp;
  1830.  
  1831.   if (if_stack == NULL)
  1832.     error ("if-less #endif");
  1833.   else {
  1834.     IF_STACK_FRAME *temp = if_stack;
  1835.     if_stack = if_stack->next;
  1836.     free (temp);
  1837.     /* JF try to keep line #s right? */
  1838.     output_line_command (&instack[indepth - 1], op);
  1839.   }
  1840. }
  1841.  
  1842. /*
  1843.  * Skip a comment, assuming the input ptr immediately follows the
  1844.  * initial slash-star.  Bump line counter as necessary.
  1845.  * (The canonical line counter is &ip->lineno).
  1846.  * Don't use this routine (or the next one) if bumping the line
  1847.  * counter is not sufficient to deal with newlines in the string.
  1848.  */
  1849. U_CHAR *
  1850. skip_to_end_of_comment (ip, line_counter)
  1851.      register FILE_BUF *ip;
  1852.      int *line_counter;        /* place to remember newlines, or NULL */
  1853. {
  1854.   register U_CHAR *limit = ip->buf + ip->length;
  1855.   register U_CHAR *bp = ip->bufp;
  1856.   FILE_BUF *op = &outbuf;    /* JF */
  1857.  
  1858.     /* JF this line_counter stuff is a crock to make sure the
  1859.        comment is only put out once, no matter how many times
  1860.        the comment is skipped.  It almost works */
  1861.   if (put_out_comments && !line_counter) {
  1862.     *op->bufp++ = '/';
  1863.     *op->bufp++ = '*';
  1864.   }
  1865.   while (bp < limit) {
  1866.     if (put_out_comments && !line_counter)
  1867.       *op->bufp++ = *bp;
  1868.     switch (*bp++) {
  1869.     case '\n':
  1870.       if (line_counter != NULL)
  1871.     ++*line_counter;
  1872.       break;
  1873.     case '*':
  1874.       if (*bp == '/') {
  1875.         if (put_out_comments && !line_counter)
  1876.       *op->bufp++ = '/';
  1877.     ip->bufp = ++bp;
  1878.     return bp;
  1879.       }
  1880.       break;
  1881.     }
  1882.   }
  1883.   ip->bufp = bp;
  1884.   return bp;
  1885. }
  1886. /*
  1887.  * skip over a quoted string.  Unlike skip_to_end_of_comment, this
  1888.  * wants ip->bufp at the beginning quote, not after it.  this is so we
  1889.  * can tell what kind of quote to match.  return if unescaped eol is
  1890.  * encountered --- it is probably some sort of error in the input.
  1891.  */
  1892. U_CHAR *
  1893. skip_quoted_string (ip, count_newlines)
  1894.      register FILE_BUF *ip;
  1895.      int count_newlines;
  1896. {
  1897.   register U_CHAR *limit = ip->buf + ip->length;
  1898.   register U_CHAR *bp = ip->bufp;
  1899.   register U_CHAR c, match;
  1900.  
  1901.   match = *bp++;
  1902.   while (bp < limit) {
  1903.     c = *bp++;
  1904.     if (c == '\\') {
  1905.       if (*bp++ == '\n' && count_newlines)
  1906.     ++ip->lineno;
  1907.     } else if (c == '\n') {
  1908.       bp -= 2;            /* whoa!  back up to eol and punt. */
  1909.       break;
  1910.     } else if (c == match)
  1911.       break;
  1912.   }
  1913.   ip->bufp = bp;
  1914.   return bp;
  1915. }
  1916.  
  1917. /*
  1918.  * write out a #line command, for instance, after an #include file.
  1919.  */
  1920. static
  1921. output_line_command (ip, op)
  1922.      FILE_BUF *ip, *op;
  1923. {
  1924.   int len, line_cmd_buf[500];
  1925.  
  1926.   if (ip->fname == NULL)
  1927.     return;
  1928.  
  1929. #ifdef OUTPUT_LINE_COMMANDS
  1930.   sprintf(line_cmd_buf, "#line %d \"%s\"\n", ip->lineno, ip->fname);
  1931. #else
  1932.   sprintf(line_cmd_buf, "# %d \"%s\"\n", ip->lineno, ip->fname);
  1933. #endif
  1934.   len = strlen(line_cmd_buf);
  1935.   check_expand (op, len);
  1936.   if (op->bufp > op->buf && op->bufp[-1] != '\n')    /* JF make sure */
  1937.       *op->bufp++ = '\n';
  1938.   bcopy (line_cmd_buf, op->bufp, len);
  1939.   op->bufp += len;
  1940. }
  1941.  
  1942.  
  1943. /* Expand a macro call.
  1944.    HP points to the symbol that is the macro being called.
  1945.    IP is the input source for reading the arguments of the macro.
  1946.    Send the result of the expansion to OP.
  1947.    EXCESS_NEWLINES_PTR points to an integer;
  1948.    we increment that integer once for each newline swallowed
  1949.    in the process of reading this macro call.  */
  1950.  
  1951. macroexpand (hp, ip, op, excess_newlines_ptr)
  1952.      HASHNODE *hp;
  1953.      FILE_BUF *ip, *op;
  1954.      int *excess_newlines_ptr;
  1955. {
  1956.   FILE_BUF *ip2;
  1957.   int nargs;
  1958.   DEFINITION *defn = hp->value.defn;
  1959.   int newlines_found = 0;
  1960.  
  1961.   /* it might not actually be a macro.  */
  1962.   if (hp->type != T_MACRO)
  1963.     return expand_special_symbol (hp, ip, op);
  1964.  
  1965.   ip2 = &instack[indepth++];
  1966.   bzero (ip2, sizeof (FILE_BUF)); /* paranoia */
  1967.  
  1968.   nargs = defn->nargs;
  1969.  
  1970.   if (nargs >= 0)
  1971.     {
  1972.       register U_CHAR *bp, *xbuf;
  1973.       U_CHAR *skip_macro_argument ();
  1974.       register int i;
  1975.       int xbuf_len;
  1976.       int offset;        /* offset in expansion,
  1977.                    copied a piece at a time */
  1978.       int totlen;        /* total amount of exp buffer filled so far */
  1979.  
  1980.       register struct reflist *ap;
  1981.       struct argptrs {
  1982.                U_CHAR *argstart;
  1983.                int length;
  1984.              } *args;
  1985.  
  1986.       args = (struct argptrs *) alloca ((nargs + 1) * sizeof (struct argptrs));
  1987.       if (ip->bufp >= ip->buf+ip->length)
  1988.     {            /* JF evil magic to make things work! */
  1989.       ip = &instack[indepth-3];
  1990.     }
  1991.       bp = ip->bufp;
  1992.  
  1993.       /* make sure it really was a macro call. */
  1994.       if (isspace(bp[-1])) {
  1995.     while (isspace (*bp)) {
  1996.       if (*bp == '\n')
  1997.         ++newlines_found;
  1998.       bp++;
  1999.     }
  2000.     if (*bp != '(')
  2001.       goto nope;
  2002.     bp++;            /* skip over the paren */
  2003.       }
  2004.       else if (*(bp-1) != '(')
  2005.     goto nope;
  2006.  
  2007.       for (i = 0; i < nargs; i++) {
  2008.     args[i].argstart = bp;
  2009.     bp = skip_macro_argument(bp, ip, &newlines_found);
  2010.     args[i].length = bp - args[i].argstart;
  2011.     if (*bp == ',')
  2012.       bp++;
  2013.       }
  2014.       args[nargs].argstart = bp;
  2015.       if (*bp++ != ')')
  2016.     goto nope;
  2017.  
  2018.       /* make a rescan buffer with enough room for the pattern plus
  2019.      all the arg strings. */
  2020.       xbuf_len = defn->length + 1;
  2021.       for (ap = defn->pattern; ap != NULL; ap = ap->next)
  2022.     xbuf_len += args[ap->argno - 1].length;
  2023.       xbuf = (U_CHAR *) alloca (xbuf_len);
  2024.  
  2025.       offset = totlen = 0;
  2026.       for (ap = defn->pattern; ap != NULL; ap = ap->next) {
  2027.     bcopy (defn->expansion + offset, xbuf + totlen, ap->nchars);
  2028.     totlen += ap->nchars;
  2029.     offset += ap->nchars;
  2030.  
  2031.     if (ap->argno > 0) {
  2032.       bcopy (args[ap->argno - 1].argstart, xbuf + totlen,
  2033.          args[ap->argno - 1].length);
  2034.       totlen += args[ap->argno - 1].length;
  2035.     }
  2036.  
  2037.     if (totlen > xbuf_len)
  2038.       {
  2039.         /* impossible */
  2040.         error ("cpp impossible internal error: expansion too large");
  2041.         goto nope;        /* this can't happen??? */
  2042.       }
  2043.       }
  2044.  
  2045.       /* if there is anything left after handling the arg list,
  2046.      copy that in too. */
  2047.       if (offset < defn->length) {
  2048.     bcopy (defn->expansion + offset, xbuf + totlen,
  2049.            defn->length - offset);
  2050.     totlen += defn->length - offset;
  2051.       }
  2052.  
  2053.       ip2->buf = xbuf;
  2054.       ip2->length = totlen;
  2055.  
  2056.       /* skip the input over the whole macro call. */
  2057.       ip->bufp = bp;
  2058.  
  2059.     }
  2060.   else
  2061.     {
  2062.       ip2->buf = ip2->bufp = defn->expansion;
  2063.       ip2->length = defn->length;
  2064.     }
  2065.  
  2066.   rescan (ip2, op);
  2067.   --indepth;
  2068.   *excess_newlines_ptr += newlines_found;
  2069.   ip->lineno += newlines_found;
  2070.  
  2071.   return 0;
  2072.  
  2073.  nope:
  2074.   error ("argument mismatch");
  2075.   --indepth;
  2076.   return 1;
  2077. }
  2078.  
  2079. /*
  2080.  * skip a balanced paren string up to the next comma.
  2081.  */
  2082. U_CHAR *
  2083. skip_macro_argument(bp, ip, newlines)
  2084.      U_CHAR *bp;
  2085.      FILE_BUF *ip;
  2086.      int *newlines;
  2087. {
  2088.   int paren = 0;
  2089.   int quotec = 0;
  2090.  
  2091.   while (bp < ip->buf + ip->length) {
  2092.     switch (*bp) {
  2093.     case '(':
  2094.       paren++;
  2095.       break;
  2096.     case ')':
  2097.       if (--paren < 0)
  2098.     return bp;
  2099.       break;
  2100.     case '\n':
  2101.       ++*newlines;
  2102.       break;
  2103.     case '/':
  2104.       if (bp[1] != '*' || bp + 1 >= ip->buf + ip->length)
  2105.     break;
  2106.       bp += 2;
  2107.       while ((bp[0] != '*' || bp[1] != '/')
  2108.          && bp + 1 < ip->buf + ip->length)
  2109.     {
  2110.       if (*bp == '\n') ++*newlines;
  2111.       bp++;
  2112.     }
  2113.       break;
  2114.     case '\'':        /* JF handle quotes right  */
  2115.     case '\"':
  2116.       for (quotec = *bp++; bp < ip->buf + ip->length && *bp != quotec; bp++)
  2117.     {
  2118.       if (*bp == '\\') bp++;
  2119.       if (*bp == '\n')
  2120.         ++*newlines;
  2121.     }
  2122.       break;
  2123.     case ',':
  2124.       if (paren == 0)
  2125.     return bp;
  2126.       break;
  2127.     }
  2128.     bp++;
  2129.   }
  2130.   return bp;
  2131. }
  2132.  
  2133. /*
  2134.  * error - print out message.  also make print on stderr.  Uses stdout
  2135.  * now for debugging convenience.
  2136.  */
  2137. error (msg)
  2138.      U_CHAR *msg;
  2139. {
  2140.   int i;
  2141.   FILE_BUF *ip = NULL;
  2142.  
  2143.   for (i = indepth - 1; i >= 0; i--)
  2144.     if (instack[i].fname != NULL) {
  2145.       ip = &instack[i];
  2146.       break;
  2147.     }
  2148.  
  2149.   if (ip != NULL)
  2150.     fprintf(stderr, "file %s, offset %d (line %d): ",
  2151.         ip->fname, ip->bufp - ip->buf, ip->lineno);
  2152.   fprintf(stderr, "%s\n", msg);
  2153.   return 0;
  2154. }
  2155.  
  2156. /*
  2157.  * if OBUF doesn't have NEEDED bytes after OPTR, make it bigger
  2158.  *    this should be a macro, for speed.
  2159.  * The "expand" in the name of this routine means buffer expansion,
  2160.  * not macro expansion.  It may become necessary to have some hacky
  2161.  * mechanism for flushing out the output buffer if it gets too big.
  2162.  *
  2163.  * As things stand, nothing is ever placed in the output buffer to be
  2164.  * removed again except when it's KNOWN to be part of an identifier,
  2165.  * so flushing and moving down everything left, instead of expanding,
  2166.  * should work ok.
  2167.  */
  2168. U_CHAR *
  2169. check_expand(obuf, needed)
  2170.      register FILE_BUF *obuf;
  2171.      register int needed;
  2172. {
  2173.   register int i;
  2174.   register U_CHAR *p;
  2175.  
  2176.   if (obuf->length - (obuf->bufp - obuf->buf) > needed)
  2177.     return obuf->buf;
  2178.  
  2179.   i = 2 * obuf->length;
  2180.   if (needed >= i)
  2181.     i += (3 * needed) / 2;
  2182.  
  2183.   if ((p = (U_CHAR *) xrealloc (obuf->buf, i)) == NULL)
  2184.     return NULL;
  2185.   obuf->bufp = p + (obuf->bufp - obuf->buf);
  2186.   obuf->buf = p;
  2187.   obuf->length = i;
  2188.  
  2189.   return p;
  2190. }
  2191.  
  2192. /*
  2193.  * install a name in the main hash table, even if it is already there.
  2194.  *   name stops with first non alphanumeric, except leading '#'.
  2195.  * caller must check against redefinition if that is desired.
  2196.  * delete() removes things installed by install() in fifo order.
  2197.  * this is important because of the `defined' special symbol used
  2198.  * in #if, and also if pushdef/popdef directives are ever implemented.
  2199.  */
  2200. HASHNODE *
  2201. install (name, type, value)
  2202.      U_CHAR *name;
  2203.      int type;
  2204.      int value;
  2205.         /* watch out here if sizeof(U_CHAR *) != sizeof (int) */
  2206. {
  2207.   HASHNODE *hp;
  2208.   int i, len = 0, bucket;
  2209.   register U_CHAR *p;
  2210.  
  2211.   p = name;
  2212.   while (is_idchar[*p])
  2213.     p++;
  2214.   len = p - name;
  2215.  
  2216.   i = sizeof (HASHNODE) + len + 1;
  2217.   hp = (HASHNODE *) xmalloc (i);
  2218.   bucket = hashf(name, len, HASHSIZE);
  2219.   hp->bucket_hdr = &hashtab[bucket];
  2220.   hp->next = hashtab[bucket];
  2221.   hashtab[bucket] = hp;
  2222.   hp->prev = NULL;
  2223.   if (hp->next != NULL)
  2224.     hp->next->prev = hp;
  2225.   hp->type = type;
  2226.   hp->length = len;
  2227.   hp->value.ival = value;
  2228.   hp->name = ((U_CHAR *) hp) + sizeof (HASHNODE);
  2229.   bcopy (name, hp->name, len);
  2230.   return hp;
  2231. }
  2232. /*
  2233.  * find the most recent hash node for name name (ending with first
  2234.  * non-identifier char) installed by install
  2235.  */
  2236. HASHNODE *
  2237. lookup (name)
  2238.      U_CHAR *name;
  2239. {
  2240.   register U_CHAR *bp;
  2241.   register HASHNODE *bucket;
  2242.   int len;
  2243.  
  2244.   for (bp = name; is_idchar[*bp]; bp++)
  2245.     ;
  2246.   len = bp - name;
  2247.   bucket = hashtab[hashf(name, len, HASHSIZE)];
  2248.   while (bucket) {
  2249.     if (bucket->length == len && strncmp(bucket->name, name, len) == 0)
  2250.       return bucket;
  2251.     bucket = bucket->next;
  2252.   }
  2253.   return NULL;
  2254. }
  2255.  
  2256. /*
  2257.  * Delete a hash node.  Some weirdness to free junk from macros.
  2258.  * More such weirdness will have to be added if you define more hash
  2259.  * types that need it.
  2260.  */
  2261. delete(hp)
  2262.      HASHNODE *hp;
  2263. {
  2264.  
  2265.   if (hp->prev != NULL)
  2266.     hp->prev->next = hp->next;
  2267.   if (hp->next != NULL)
  2268.     hp->next->prev = hp->prev;
  2269.  
  2270.   /* make sure that the bucket chain header that
  2271.      the deleted guy was on points to the right thing afterwards. */
  2272.   if (hp == *hp->bucket_hdr)
  2273.     *hp->bucket_hdr = hp->next;
  2274.  
  2275.   if (hp->type == T_MACRO) {
  2276.     DEFINITION *d = hp->value.defn;
  2277.     struct reflist *ap, *nextap;
  2278.  
  2279.     for (ap = d->pattern; ap != NULL; ap = nextap) {
  2280.       nextap = ap->next;
  2281.       free (ap);
  2282.     }
  2283.     free (d);
  2284.   }
  2285. }
  2286.  
  2287. /*
  2288.  * return hash function on name.  must be compatible with the one
  2289.  * computed a step at a time, elsewhere
  2290.  */
  2291. int
  2292. hashf(name, len, hashsize)
  2293.      register U_CHAR *name;
  2294.      register int len;
  2295.      int hashsize;
  2296. {
  2297.   register int r = 0;
  2298.  
  2299.   while (len--)
  2300.     r = HASHSTEP(r, *name++);
  2301.  
  2302.   return MAKE_POS(r) % hashsize;
  2303. }
  2304.  
  2305.  
  2306. /*
  2307.  * initialize random junk in the hash table and maybe other places
  2308.  */
  2309. initialize_random_junk()
  2310. {
  2311.   register int i;
  2312.  
  2313.   /*
  2314.    * Set up is_idchar and is_idstart tables.  These should be
  2315.    * faster than saying (is_alpha(c) || c == '_'), etc.
  2316.    * Must do set up these things before calling any routines tthat
  2317.    * refer to them.
  2318.    */
  2319.   for (i = 'a'; i <= 'z'; i++) {
  2320.     ++is_idchar[i - 'a' + 'A'];
  2321.     ++is_idchar[i];
  2322.     ++is_idstart[i - 'a' + 'A'];
  2323.     ++is_idstart[i];
  2324.   }
  2325.   for (i = '0'; i <= '9'; i++)
  2326.     ++is_idchar[i];
  2327.   ++is_idchar['_'];
  2328.   ++is_idstart['_'];
  2329.  
  2330.   /* horizontal space table */
  2331.   ++is_hor_space[' '];
  2332.   ++is_hor_space['\t'];
  2333.  
  2334.   install("__LINE__", T_SPECLINE, 0);
  2335.   install("__DATE__", T_DATE, 0);
  2336.   install("__FILE__", T_FILE, 0);
  2337.   install("__TIME__", T_TIME, 0);
  2338.  
  2339. #ifdef vax
  2340.   make_definition("vax 1");
  2341. #endif
  2342.  
  2343. #ifdef unix
  2344.   make_definition("unix 1");
  2345. #endif
  2346.  
  2347.   /* is there more? */
  2348.  
  2349. }
  2350.  
  2351. /*
  2352.  * process a given definition string, for initialization
  2353.  */
  2354. make_definition(str)
  2355.      U_CHAR *str;
  2356. {
  2357.   FILE_BUF *ip;
  2358.   struct keyword_table *kt;
  2359.  
  2360.   ip = &instack[indepth++];
  2361.   ip->fname = "*Initialization*";
  2362.  
  2363.   ip->buf = ip->bufp = str;
  2364.   ip->length = strlen(str);
  2365.   ip->lineno = 1;
  2366.  
  2367.   for (kt = keyword_table; kt->type != T_DEFINE; kt++)
  2368.     ;
  2369.  
  2370.   /* pass NULL as output ptr to do_define since we KNOW it never
  2371.      does any output.... */
  2372.   do_define (str, str + strlen(str) /* - 1 JF */ , NULL, kt);
  2373.   --indepth;
  2374. }
  2375.  
  2376. /* JF, this does the work for the -U option */
  2377. make_undef(str)
  2378.      U_CHAR *str;
  2379. {
  2380.   FILE_BUF *ip;
  2381.   struct keyword_table *kt;
  2382.  
  2383.   ip = &instack[indepth++];
  2384.   ip->fname = "*undef*";
  2385.  
  2386.   ip->buf = ip->bufp = str;
  2387.   ip->length = strlen(str);
  2388.   ip->lineno = 1;
  2389.  
  2390.   for(kt = keyword_table; kt->type != T_UNDEF; kt++)
  2391.     ;
  2392.  
  2393.   do_undef(str,str + strlen(str) - 1, NULL, kt);
  2394.   --indepth;
  2395. }
  2396.  
  2397.  
  2398. #ifndef BSD
  2399. #ifndef BSTRING
  2400.  
  2401. void
  2402. bzero (b, length)
  2403.      register char *b;
  2404.      register int length;
  2405. {
  2406. #ifdef VMS
  2407.   short zero = 0;
  2408.   long max_str = 65535;
  2409.  
  2410.   while (length > max_str)
  2411.     {
  2412.       (void) LIB$MOVC5 (&zero, &zero, &zero, &max_str, b);
  2413.       length -= max_str;
  2414.       b += max_str;
  2415.     }
  2416.   (void) LIB$MOVC5 (&zero, &zero, &zero, &length, b);
  2417. #else
  2418.   while (length-- > 0)
  2419.     *b++ = 0;
  2420. #endif /* not VMS */
  2421. }
  2422.  
  2423. void
  2424. bcopy (b1, b2, length)
  2425.      register char *b1;
  2426.      register char *b2;
  2427.      register int length;
  2428. {
  2429. #ifdef VMS
  2430.   long max_str = 65535;
  2431.  
  2432.   while (length > max_str)
  2433.     {
  2434.       (void) LIB$MOVC3 (&max_str, b1, b2);
  2435.       length -= max_str;
  2436.       b1 += max_str;
  2437.       b2 += max_str;
  2438.     }
  2439.   (void) LIB$MOVC3 (&length, b1, b2);
  2440. #else
  2441.   while (length-- > 0)
  2442.     *b2++ = *b1++;
  2443. #endif /* not VMS */
  2444. }
  2445.  
  2446. int
  2447. bcmp (b1, b2, length)    /* This could be a macro! */
  2448.      register char *b1;
  2449.      register char *b2;
  2450.       register int length;
  2451.  {
  2452. #ifdef VMS
  2453.    struct dsc$descriptor_s src1 = {length, DSC$K_DTYPE_T, DSC$K_CLASS_S, b1};
  2454.    struct dsc$descriptor_s src2 = {length, DSC$K_DTYPE_T, DSC$K_CLASS_S, b2};
  2455.  
  2456.    return STR$COMPARE (&src1, &src2);
  2457. #else
  2458.    while (length-- > 0)
  2459.      if (*b1++ != *b2++)
  2460.        return 1;
  2461.  
  2462.    return 0;
  2463. #endif /* not VMS */
  2464. }
  2465. #endif /* not BSTRING */
  2466. #endif /* not BSD */
  2467.  
  2468.  
  2469. void
  2470. fatal (str, arg)
  2471.      char *str, *arg;
  2472. {
  2473.   fprintf (stderr, "%s: ", progname);
  2474.   fprintf (stderr, str, arg);
  2475.   fprintf (stderr, "\n");
  2476.   exit (FATAL_EXIT_CODE);
  2477. }
  2478.  
  2479. void
  2480. perror_with_name (name)
  2481.      char *name;
  2482. {
  2483.   extern int errno, sys_nerr;
  2484.   extern char *sys_errlist[];
  2485.  
  2486.   fprintf (stderr, "%s: ", progname);
  2487.   if (errno < sys_nerr)
  2488.     fprintf (stderr, "%s for %s\n", sys_errlist[errno], name);
  2489.   else
  2490.     fprintf (stderr, "cannot open %s\n", sys_errlist[errno], name);
  2491. }
  2492.  
  2493. void
  2494. pfatal_with_name (name)
  2495.      char *name;
  2496. {
  2497.   perror_with_name (name);
  2498.   exit (FATAL_EXIT_CODE);
  2499. }
  2500.  
  2501.  
  2502. static void
  2503. memory_full ()
  2504. {
  2505.   fatal ("Memory exhausted.");
  2506. }
  2507.  
  2508.  
  2509. char *
  2510. xmalloc (size)
  2511.      int size;
  2512. {
  2513.   extern char *malloc ();
  2514.   register char *ptr = malloc (size);
  2515.   if (ptr != 0) return (ptr);
  2516.   memory_full ();
  2517.   /*NOTREACHED*/
  2518. }
  2519.  
  2520. char *
  2521. xrealloc (old, size)
  2522.      char *old;
  2523.      int size;
  2524. {
  2525.   extern char *realloc ();
  2526.   register char *ptr = realloc (old, size);
  2527.   if (ptr != 0) return (ptr);
  2528.   memory_full ();
  2529.   /*NOTREACHED*/
  2530. }
  2531.  
  2532. char *
  2533. xcalloc (number, size)
  2534.      int number, size;
  2535. {
  2536.   extern char *malloc ();
  2537.   register int total = number * size;
  2538.   register char *ptr = malloc (total);
  2539.   if (ptr != 0)
  2540.     {
  2541.       bzero (ptr, total);
  2542.       return (ptr);
  2543.     }
  2544.   memory_full ();
  2545.   /*NOTREACHED*/
  2546. }
  2547.